📄 PDF Hidden Text Scanner – About / README
Verze aplikace: 1.2  
Datum: listopad 2025
Autor a vývoj: OpenTechLab Jablonec nad Nisou s. r. o.
© 2025 OpenTechLab Jablonec nad Nisou s. r. o.

Součástí je testovací PDF, které vizuálně vypadá bezpečně, ale obsahuje skrytý text a vrstvy. Slouží k ověření funkčnosti skeneru.

1. Co je PDF Hidden Text Scanner
PDF Hidden Text Scanner je bezpečnostní nástroj určený k odhalování skrytých prvků v PDF, které nejsou viditelné běžnému uživateli, zejména:

skrytého textu,
prompt-injection útoků,
skrytých vrstev (OCG),
anotací a formulářových polí s textem,
embedded (vložených) souborů,
podezřelých metadat,
PDF akcí (/JS, /Launch, /URI…),
textu mimo viditelnou oblast (off-canvas),
textu skrytého barvou, překrytým objektem, nebo extrémně malým písmem,
textu skrytého rendering módem (např. Tr = 3),
textu s nulovou průhledností (α = 0).

Cílem je detekovat obsah, který může být zneužit:

pro útoky typu prompt injection,
pro vložení tajných instrukcí do AI systémů,
ke skrytí komentářů nebo citlivých dat,
k manipulaci dokumentů nebo sociálnímu inženýrství.

2. Bezpečnostní architektura

Každý dokument je analyzován v samostatném izolovaném worker procesu, který má:

časový limit (10 s),
paměťový limit (512 MB),
oddělené prostředí (sandbox),
bez možnosti interpretace JavaScriptu v PDF,
bez spouštění PDF akcí,
bez vykonávání embedded souborů,
bez provádění systémových příkazů.

Pokud PDF obsahuje:

poškozená data,
exploit na dekodéry (JBIG2/JPEG2000/fonty),
extrémně velké objekty,
nebo crafted payloady,

→ může maximálně spadnout worker proces.
GUI zůstává bezpečně běžet.

3. Co aplikace nikdy nedělá

❌ Nespouští PDF JavaScript
❌ Nespouští /Launch ani jiné aktivní akce
❌ Nespouští vložené soubory
❌ Neotevírá multimedia/3D objekty
❌ Neprovádí systémové příkazy
❌ Nevykonává žádný kód z dokumentu
❌ Nesdílí žádná data mimo zařízení
❌ Neodesílá dokumenty nebo výsledky analýzy

Aplikace pouze čte strukturu PDF.

4. Detekované typy skrytí

Typ skrytí		Detekováno	Popis

Bílý text na bílém		✔	Skrytí barvou
Překrytý objekt			✔	Text zakrytý obdélníkem nebo grafikou
Mikro-font (např. 0.1 pt)	✔	Skrytý text velikostí
Rendering mód 3 (Tr=3)		✔	Neviditelné vykreslení
Alpha = 0			✔	Plná průhlednost
Off-canvas text			✔	Text mimo stránku
Skryté vrstvy (OCG)		✔	Vrstvy s on=False
Anotace				✔	I mimo viditelnou oblast
Formulářová pole		✔	Skrytá nebo mimo stránku
Embedded soubory		✔	Kompletní výpis
Metadata			✔	Keywords, Subject, Title…
PDF akce			✔	/OpenAction, /JS, /Launch, /URI

5. Jak číst výsledky

Červeně – rizikový nebo skrytý obsah
Světle modře – konkrétní text nebo hodnota
„INFO:“ – informace vyžadující pozornost
Exit code 1 – dokument je podezřelý
Exit code 0 – dokument je v pořádku

6. Kdy aplikace označí dokument jako podezřelý

nalezen jakýkoli skrytý obsah,
nalezeny PDF akce,
skryté vrstvy, anotace nebo embedded soubory,
překročen časový limit workeru,
překročen paměťový limit,
worker proces spadne nebo PDF je crafted.

7. Omezení

Aplikace není antivir. Nedetekuje:

zero-day exploity v PDF rendererech,
malware v binárních vložených souborech,
škodlivé dokumenty Word/Excel/PPT vložené do PDF,
phishingové odkazy,
PDF, která využívají obfuskovaný obsah mimo textové vrstvy.

Slouží primárně pro bezpečnostní kontrolu PDF před jejich použitím v AI systémech.

8. Offline režim

Aplikace může pracovat 100% offline.
Neposílá dokumenty ani analýzy na internet.

9. Reklamy

Aplikace zobrazuje pouze:

vlastní propagační bannery OpenTechLab,
bez externích reklamních systémů,
bez sledování aktivit uživatele,
bez profilování,
bez cookies a trackerů.

10. Doporučení pro bezpečné používání

neotevírej podezřelé PDF v Adobe Readeru,
před otevřením PDF z e-mailu používej sandbox,
pro kritické dokumenty použij antivir/EDR,
vždy zkontroluj metadata a případné odkazy.

11. Kontakt

OpenTechLab Jablonec nad Nisou s. r. o.
www.opentechlab.cz

📄 END USER LICENSE AGREEMENT (EULA)

Copyright © OpenTechLab Jablonec nad Nisou s. r. o.

1. Licence

Aplikace je poskytována jako freeware.
Uživatel získává nevýhradní, nepřenositelné právo používat program zdarma pro osobní i komerční účely.
Všechna práva náleží autorovi.

2. Omezení

Uživatel nesmí:

upravovat nebo modifikovat program,
obcházet ochranu či zasahovat do aplikace,
provádět reverse engineering nebo dekompilaci,
distribuovat aplikaci (celou či části) bez písemného souhlasu autora.

3. Ochrana soukromí

Aplikace:

nesbírá žádná osobní data,
neodesílá žádná PDF, výsledky ani logy,
komunikuje pouze při načítání vlastních reklamních bannerů OpenTechLab,
funguje plně offline.

4. Reklamy

Aplikace může zobrazovat pouze vlastní propagační obsah OpenTechLab.
Nepoužívá žádné externí reklamní systémy ani sledovací mechanismy.

5. Bezpečnostní omezení

Aplikace:

neprovádí žádný kód z PDF,
neprovádí makra, JavaScript ani systémové příkazy,
neotevírá embedded soubory,
slouží výhradně k pasivní analýze.
Výsledky mohou být neúplné nebo nemusí pokrýt všechny typy hrozeb.
Uživatel používá aplikaci na vlastní riziko.

6. Vyloučení odpovědnosti

Software je poskytován „tak jak je“.
Autor není odpovědný za:

škody vzniklé použitím aplikace,
ztrátu dat,
přímé či nepřímé škody,
následné či jiné škody.

7. Aktualizace

Autor může poskytovat aktualizace.
Uživatel není povinen je instalovat.

8. Právní jurisdikce

Licence se řídí právním řádem České republiky.
Případné spory budou řešeny příslušným soudem autora.